Built 26/04/15 21:42commit 9419fc3
中文 | English
Code Review 与 Test Time Compute —— Boris Cherny 的建议
这是 Boris Cherny(@bcherny)在 2026-03-10 分享的两条洞见总结。
1/ 引入 Code Review
Claude Code 新增了 Code Review:一组 agent 会对每个 PR 做深度审查。
- 这个能力最初是先为 Anthropic 自己的团队构建的。随着每位工程师的代码产出提高,review 成了瓶颈。
- Boris 已经用了几周,结论是它能发现许多原本不会注意到的真实 bug。
- 当一个 PR 打开时,Claude 会派出多个 agent 去主动寻找问题。
2/ Test Time Compute 与多个上下文窗口
粗略来说,给编码问题投入的 token 越多,结果往往越好。Boris 把这称为 test time compute。
- 使用 彼此独立的上下文窗口 会让结果更好,这正是 subagents 有效的原因之一:一个 agent 可能制造 bug,另一个使用相同模型的 agent 却更容易把它找出来。
- 这和工程团队很像:如果 Boris 自己写出了 bug,他的同事在 review 时代码反而更容易发现它。
- 从极限上看,agent 也许终有一天会写出完美无 bug 的代码;在那之前,多个彼此不相关的上下文窗口 通常是更稳的做法。